import os
import pandas as pd

# 定义文件夹路径和目标 Excel 文件路径
folder_path = './data/base'  # 替换为实际文件夹路径
excel1_path = './data/file1.xlsx'  # 替换为目标 Excel 文件路径

# 读取 excel1
excel1 = pd.read_excel(excel1_path)

# 创建一个新的列用于存储产品服务内容
excel1['Products_and_Services'] = None

# 遍历文件夹中的所有 Excel 文件
for file_name in os.listdir(folder_path):
    if file_name.endswith('.xlsx') or file_name.endswith('.xls'):  # 确保是 Excel 文件
        file_path = os.path.join(folder_path, file_name)

        # 读取当前 Excel 文件
        current_excel = pd.read_excel(file_path)

        # 检查是否包含 "公司" 和 "产品服务" 列
        if 'company_name' in current_excel.columns and 'Products_and_Services' in current_excel.columns:
            # 遍历当前 Excel 中的每一行
            for _, row in current_excel.iterrows():
                company_name = row['company_name']
                product_service = row['Products_and_Services']

                # 如果公司名称存在于 excel1 中
                if company_name in excel1['company_name'].values:
                    # 更新 excel1 中对应公司的 "产品服务" 列
                    excel1.loc[excel1['company_name'] == company_name, 'Products_and_Services'] = product_service

# 保存更新后的 excel1
output_path = 'updated_excel1.xlsx'
excel1.to_excel(output_path, index=False)

print(f"处理完成，结果已保存到 {output_path}")